1
Estadísticos como Variables Aleatorias: La Distribución Muestral
MATH003Lesson 4
00:00
En la inferencia estadística, pasamos de observar puntos de datos individuales a analizar un **estadístico**, una función de mapeo $Y = h(X_1, X_2, \dots, X_n)$ de una secuencia muestral. Dado que la muestra subyacente está compuesta por variables aleatorias, el estadístico en sí mismo es una variable aleatoria, y su ley de probabilidad se conoce como la **distribución muestral**.

El Estadístico como un Mapeo

Un estadístico se define formalmente como una función $h: \mathbb{R}^n \to \mathbb{R}$. Definimos la probabilidad de que el estadístico caiga en un conjunto $B$ utilizando la imagen inversa:

$$h^{-1} B = \{(x_1, x_2, \dots, x_n) : h(x_1, x_2, \dots, x_n) \in B\}$$

Fundamento I.I.D.

Para una muestra de variables aleatorias i.i.d. (independientes e idénticamente distribuidas), la probabilidad conjunta de un punto muestral específico $(x_1, \dots, x_n)$ es el producto de sus probabilidades marginales: $p(x_1)p(x_2)\dots p(x_n)$. Este producto sirve como peso para cada punto al calcular la probabilidad total de que el estadístico tome un valor específico.

Ejemplo 4.1.1: La Media Geométrica

Considere una población discreta donde $p_X(1) = 1/2$, $p_X(2) = 1/4$ y $p_X(3) = 1/4$. Extraemos una muestra de tamaño $n=2$ ($X_1, X_2$) y definimos nuestro estadístico como la media geométrica: $Y_2 = (X_1 X_2)^{1/2}$.

Para encontrar la distribución de $Y_2$, listamos todas las 9 parejas posibles $(X_1, X_2)$, calculamos su probabilidad conjunta y el valor resultante de $Y_2$:

Pareja $(x_1, x_2)$Prob $P(x_1)P(x_2)$$Y = \sqrt{x_1 x_2}$
(1, 1)1/41.000
(1, 2), (2, 1)1/8 + 1/8 = 1/41.414
(1, 3), (3, 1)1/8 + 1/8 = 1/41.732
(2, 2)1/162.000
(2, 3), (3, 2)1/16 + 1/16 = 1/82.449
(3, 3)1/163.000

Distribuciones Exactas frente a Asintóticas

Antes de avanzar hacia teoremas límite como el Teorema del Límite Central (TLC), debemos dominar la "Distribución Exacta". Esto implica calcular la función específica de masa o densidad de probabilidad para un estadístico dado un valor pequeño y finito de $n$. Cuando la forma analítica se vuelve intratable, recurrimos a simulaciones numéricas como las **aproximaciones de Monte Carlo**.

🎯 Principio Fundamental
Una distribución muestral es la distribución de una variable aleatoria correspondiente a una función de una secuencia i.i.d. Es el puente entre los datos crudos y la inferencia científica.